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基于 KECA 和 FWA-SVM 的 间歇 过 程 分 时 段 故 障 诊断 方法 


殖 振 宇 ， 张 ” 敏 ， 包 珊 珊 
(西南 交通 大 学 机 械 工程 学 院 , 成 都 610031) 


摘 要 : 针对 间 歌 过 程 的 高 度 复 杂 性 、 强 非 线性 、 强 时 段 性 等 特点 ， 提 出 一 种 基于 核 粒 成 分 分 析 (KECA) 特征 变量 降 
维 ， 利 用 烟花 算法 (EWA) 优化 支持 向 量 机 (SVM) 参数 的 间 歌 过 程 分 时 段 故 障 诊 断 方法 。 首 先 ， 通 过 多 向 核 主 元 分 
析 (MKPCA) 进行 在 线 故障 监测 ， 输 出 故障 数据 ; 其 次 ， 利 用 KK-means 分 类 方法 将 间 软 过 程 划分 为 若干 个 子 时 段 ， 对 
故障 数据 进行 KECA 特征 变量 处 理 ， 按 粒 值 贡献 率 来 确定 选取 主 元 的 个 数 ， 深 层 提 取 特 征 信息 ; 最 后 ， 在 各 子 时 段 内 
分 别 构建 FWA 优化 SVM 参数 故障 诊断 模型 ,将 降 维 处 理 后 的 故障 数据 代入 各 自 所 属 子 时 段 FWA-SVM 诊断 模型 内 进 
行 故障 诊断 。 通 过 对 青霉素 仿真 实验 数据 进行 各 种 对 比 实验 研究 ， 验 证 了 该 方法 的 可 行 性 与 有 效 性 。 
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Time division fault diagnosis method based on KECA and FWA - SVM for batch process 


Cai Zhenyu, Zhang Min, Bao Shanshan 
(School of Mechanical Engineering, Southwest Jiaotong University, Chengdu 610031, China) 


Abstract: Aiming at the high complexity, strong nonlinearity and strong time characteristics of intermittent process, this paper 
proposed a new method based on kernel entropy component analysis (KECA) to reduce the dimensionality of the KECA 
characteristic variables, and used the fireworks algorithm (FWA) to optimize the support vector machine (SVM) parameters for 
the intermittent process of division fault diagnosis method. Firstly, it carried out multi-directional kernel principal component 
analysis (MKPCA ) for the on-line fault monitoring and output the fault data. Second, it used K-means method to divid the batch 
process into several sub-periods. It used KECA to reduce characteristic variable dimensionality according to the contribution 
rate of entropy to determine the number of selected elements and extracted feature information in depth. Finally, constructed 
FWA optimized SVM parameter fault diagnosis model in each sub-period, put the reduced dimension processed fault data into 
their own sub-period FWA-SVM diagnostic model for fault diagnosis. Through a variety of comparative experimental study 
based on penicillin simulation data, verified the feasibility and effectiveness of this method. 
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间 内 进行 数据 重 构 与 建立 统计 量 监控 图 ， 难 以 直接 应 用 于 间 和 区 
过 程 在 线 监控 。 为 此 Yoo 等 人 四 提出 了 基于 KPCA 的 非 线 性 监 
间 砍 过 程 广泛 存在 于 现代 生产 生活 当中 ， 如 食品 、 材 料 、 测 方法 并 应 用 于 间歇 过 程 在 线 监 控 ， 研 究 表明 KPCA 算法 比 
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化 工 和 制药 等 器 , 因此 实现 高 效 故 障 监测 与 故障 诊断 至 关 重 要 。 ”PCA 算法 监控 性 能 更 优 。 多 时 段 性 研究 中 多 存在 于 间歇 过 程 故 
间 敬 过 程 生 产 周 期 短 、 操 作 过 程 重复 性 高 、 系 统 内 部 动态 特性 ”” 障 监测 方面 ， 但 间 笛 过 程 故障 诊断 也 存在 很 强 的 时 段 性 。 

变化 快 ， 难 以 构造 准确 的 数学 模型 中。 主 元 分 析 (principal 间歇 过 程 变量 维度 过 高 ， 将 变量 进行 一 定 的 降 维 处 理 能 提 
component analysis, PCA)BI 进 行 监测 建 模 是 一 种 线性 建 模 方法 ， 高 故障 诊断 的 稳定 性 与 高 效 性 。 PCAL5 是 应 用 广泛 的 经 典 数据 
对 于 非 线性 系统 如 生物 发 酵 往往 不 能 保证 其 监测 效果 。 和 针对 非 ”” 降 维 方法 之 一 ， 但 对 于 非 线 性 数据 利用 线性 映射 存在 一 定 的 局 


线性 过 程 监测 的 建 模 问题 ，Scholkopf 等 人 四 将 核 函 数理 论 应 用 限 性 。KPCA 是 PCA 非 线性 的 推广 中 ,但 数据 处 理 与 PCA 类 
到 统计 过 程 监控 中 ， 提 出 了 核 主 元 分 析 (kernel principal 以 ,利用 特征 值 大 小 来 实现 降 维 , 降 维 效果 存在 一 定 的 波动 性 。 


component analysis, KPCA) 。 但 KPCA 算法 不 能 直接 在 特征 空 Jenssen00 在 KPCA 的 基础 上 提出 核 箭 成 分 分 析 (kernel entropy 
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于 数据 降 维 。 不 同 于 KPCA 与 
PCA 算法 ，KECAIMM 是 计算 Renyi 灶 来 实现 数据 降 维 ， 在 提取 
数据 特征 上 表现 出 了 其 独特 的 优越 性 ， 比 传统 的 PCA、KPCA 
更 加 稳定 。 

支持 向 量 机 (support vector machine, SVM) [2 运用 于 故障 
诊断 方面 越 来 越 成 熟 ， 但 SVM 通过 核 参 数 将 特征 向 量 映射 到 
高 维特 征 空 间 实 现 分 类 ， 参 数 的 确定 影响 整个 分 类 效果 。 利 用 
传统 的 遗传 算法 (genetic algorithm，GA)、 粒 子 群 算法 (particle 
Swarm optimization, PSO) 和 交叉 验证 算法 做 SVM 参数 优化 
有 良好 的 效果 ， 但 是 都 存在 一 定 缺 陷 。 例 如 GA 在 计算 过 程 中 
和 欠 代 收敛 时 间 较 长 , PSO 则 易 受 局 部 粒子 最 优 影响 ,出现 “早熟 
现象 ”等 。 何 青 等 人 0 用 果 蝇 优化 算法 优化 SVM 参数 ， 但 测试 
集 量 少 ， 大 量 数 据 下 还 需 进 一 步 验 证 。 烟 花 算 法 (firework 
algorithm, FWA) 是 Tan 等 人 04 在 2010 年 提出 的 一 种 新 型 进化 
算法 ， 具 有 很 强 的 优化 求解 能 力 ， 并 且 能 够 在 局 部 和 全 局 搜索 
达到 一 个 平衡 效果 ， 近 年 来 逐渐 受到 研究 者 的 关注 。 
基于 此 ， 本 文 提出 一 种 新 型 、 应 用 于 间 敬 过 程 故 障 诊断 的 
方法 。 首 先 采 用 多 向 核 主 元 分 析 (multiway kernel principal 
component analysis, MKPCA) 构 建 在 线 监 测 模型 实现 间歇 过 程 
故障 监测 ， 并 输出 故障 数据 ; 将 间歇 过 程 基于 K-means 方法 划 
分 为 有 限 个 子 时 段 ， 标 记 故 障 数据 所 属 子 时 段 ; 通过 KECA 对 
故障 数据 进行 变量 降 维 ， 提 取 其 有 效 信息 ; 最 后 利用 FWA 优 
化 SVM 分 类 参数 ,在 各 子 时 段 分 别 构建 FEWA-SVM 诊断 模型 ， 


component analysis, KECA) 算 法 | 


将 处 理 后 的 故障 数据 代入 其 对 应 的 子 时 段 模型 内 进行 故障 诊断 。 


最 后 通过 青霉素 仿真 实验 数据 进行 仿真 实验 和 各 种 对 比 实验 研 
究 验 证 了 该 方法 的 有 效 性 。 


1 MKPCA 间歇 过 程 在 线 故 障 监 测 


1.1 数据 预 处 理 

间歇 过 程 数据 处 1xJxK), 比 连续 过 程 数 据 多 出 一 维 批 次 元 
素 , 1 表示 批量 数 ，J 表示 变量 数 ，K 表示 采样 点 数 。 将 三 维 数 
据 (7xJxA) 沿 批 次 方向 展开 得 到 XIxJK)， 每 行 是 一 个 批 次 的 
所 有 数据 ， 展 开 方式 如 图 1 所 示 。 本 文 假设 各 个 批 次 操作 时 间 


蔡 振 宇 ， 等 : 基于 KECA 和 FWA-SVM 的 间 歌 过 程 分 时 段 故障 诊断 方法 
1.2 在线 故障 监测 

三 维 数据 集 X(1xJxK) 按 上 述 沿 批 次 展开 后 得 到 二 维 数据 
集 X(1xJK)， 再 代入 MKPCA 模型 内 进行 在 线 故障 监测 。 首 先 
利用 正常 工 况 下 二 维 数据 XIxJK) 进 行 离线 分 析 计 算 统 计量 
Hotelling T2 和 平方 预测 误差 (squared prediction error, SPE) 的 控 
制 限 ， 再 进行 在 线 监 测 。T? 统 计量 通 过 表征 模型 内 部 变化 来 反 
映 多 变量 变化 情况 ， 定 义 为 


一 .7 7T 


72 = 三 Xp4 TP (1) 


T? 统计 量 的 控制 限 可 利用 分 布 计算 获得 ， 如 式 〈2) 所 


2 = Pb) = 
lim n(n p) (p,n Dp) (2) 


其 中 : n 为 样本 数目 , p 为 主 元 个 数 。 
平方 预测 误差 SPE 又 可 称 为 Q 统计 量 法 , 表示 大 时刻 的 监 
测 值 对 模型 的 偏离 程度 ， 是 衡量 模型 外 部 数据 变化 的 测度 ， 定 
义 为 


SPE GY -OP= De Dr G) 
SPE 统计 量 在 置信 区 间 下 的 控制 限 通过 正太 分布 确定 : 
SPE,, = qr 0 TU ep (4) 
a= Yo G) 
=1- 7 (6) 


其 中 : c 为 与 正 态 分布 1 一 Q) 分 位 点 对 应 的 标准 闫 
的 显著 水 平 。 
当 在 线 故 障 监测 时 ， 由 于 进行 在 线 监测 时 所 得 数据 只 有 从 
开始 到 监测 时 刻 点 的 数据 ， 但 监测 时 需要 整个 批 次 数据 ， 所 以 
本 文 利 用 当前 值 对 监测 数据 进行 填充 以 满足 整体 批 次 数据 ， 再 
计算 监测 数据 采样 点 的 统计 量 指标 2 和 SPE, 与 其 相对 应 的 控 
制 限 进行 比较 。 当 监测 数据 连续 超过 任 一 控制 限 大 于 等 于 3 个 


; 0 为 给 定 


相同 , 在 新 构建 的 三 维 数据 矩阵 XC0xJK) 中 加 入 均值 为 零 、 方 差 
为 0.01 的 和 白 噪 声 和 矩阵 ， 去 除 噪声 干扰 ， 最 后 对 合成 的 二 维 数据 
矩阵 进行 按 列 标准 化 处 理 。 


图 1 MKPCA 数据 矩阵 分 解 


采样 时 刻 时 ， 则 判断 当前 有 故障 发 生 。 
2 ”间歇 过 程 的 分 时 段 故障 诊断 


2.1 K-means 聚 类 算法 

间 欣 过 程 很 少 有 论文 进行 分 时 段 故 障 诊断 研究 ， 因 此 分 时 
段 故 障 诊断 为 本 文 一 重点 研究 .间歇 过 程 数据 经 过 二 维 展开 后 ， 
于 存在 时 段 性 , 代入 人 -means 算法 内 进行 时 段 划 分 。K-means 
算法 的 原理 是 先 随机 产生 工 个 初始 位 置 点 作为 L 个 簇 的 初始 中 
心 点 ， 将 邻近 的 点 分 到 最 近 的 徐 ， 然 后 计算 各 个 簇 的 质心 ， 重 
新 确定 新 的 质心 。 如 此 不 断 地 进行 迭代 ， 直 到 质心 的 移动 范围 
满足 所 需要 求 或 者 迭代 要 求 。 

假设 初始 聚 类 中 心 Z={z,zzi} 及 聚 类 数据 
体操 作 步 又 分 为 以 下 5 步 : 


= 二 {4, 力 )…} , 则 KK-means 算法 
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a) 从 nn 个 数据 中 随机 选取 工 个 对 象 作为 初始 聚 类 中 心 。 

b) 计算 每 个 数据 对 象 eX 到 工 个 聚 类 对 象 
zj(j= 上 2…L) 的 距离 ， 本 文采 用 马 氏 距离 。 

c) 聚 类 完成 后 重新 计算 该 聚 类 中 距离 每 一 个 点 的 最 近 的 中 


心 点 。 

d) 若 与 上 一 次 计算 出 的 聚 类 中 心 相 同 ,说 明 聚 类 结果 成 立 ， 
则 转 到 e) ; 若 与 上 一 次 计算 出 来 的 聚 类 中 心 不 同 , 说 明 聚 类 还 
未 完成 ， 则 转 到 b) 重新 进行 计算 。 若 满足 迭代 要 求 ， 则 转 到 
BY 


a 
e) 结束 并 输出 聚 类 结果 。 


2.2 故障 特征 提取 与 降 维 处 理 

当 在 线 监测 判断 当前 批 次 数据 有 故障 发 生 时 ， 由 于 间歇 过 
程 是 复杂 生产 过 程 ， 往 往 会 使 故障 变量 随后 传递 ， 掩 新 后 面 变 
量 信息 ,所 以 只 提取 发 生 故 障 之 后 的 若干 采样 点 作为 故障 数据 ， 
使 获得 的 故障 数据 更 具有 代表 性 ， 提 高 故障 诊断 率 。 间 和 敬 过 程 
数据 县 有 非 线 性 和 变量 维 数 较 高 的 特性 ， 本 文采 用 KECA 算法 
对 故障 数据 进行 特征 降 维 ， 提 取 有 效 信息 ， 从 而 实现 高 效 故 障 
诊断 。 

KECA 是 一 种 不 同 于 传统 “ 谱 方 法 ”的 非 线 性 降 维 算法 ， 能 
够 将 数据 降 维 前 后 的 Renyi 炉 损失 最 小 化 。 设 某 一 概率 系统 中 
有 nn 个 事件 或 数据 集 (Xi,X,,…X,,) ， 第 i 个 事件 天 产生 的 概率 
为 RG=1,2..…n)， 则 其 数据 的 Renyi 业 指 标 可 以 表示 为 


H(p)=-lg| p* Car 0 


调 函 数 ， 因 此 可 以 只 对 积分 一 部 分 进行 单独 


PU 
Im. 
en 
i 
| 


对 数 函 数 
定义 : 


V(p)=| par (8) 


需要 对 Vlp) 进 行 估计 计算 ， 才 可 以 求 出 Renyi 箭 。 文 中 引 


入 Parzen 概率 密度 算 子 3, 根据 高 斯 函数 卷 积 理论 并 结合 函数 
的 单调 性 ， 化 简 得 到 
1 n nn 1 
Vm oe 克 09) 
Kj = K f(s)) (10) 
其 中 : 7 为 每 个 元 素 均 为 1 的 N 维 向 量 ; K 为 样本 核 矩 阵 。 


通过 式 (11) 实 现 了 Renyi 录 的 核 矩 阵 表 达 ， 对 核 矩 阵 进 行 
分 解 ， 表 示 为 


K = ED,E’ (11) 

其 中 : Di 为 特征 值 4… 色 组 成 的 对 角 和 矩阵 ; 五 为 对 应 的 特征 向 
量 a…e, 组 成 的 矩阵 。 
因此 , 式 (9) 进 


步 可 表示 为 
1 志 
Vp -= Ve (12) 


式 〈12) 表明 每 个 K 的 特征 值 和 特征 向 量 对 炉 值 的 估计 都 
有 自己 的 贡献 ， 但 贡献 大 小 并 不 一 致 。 
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2.3 多 分 类 支持 向 量 机 

支持 向 量 机 实现 多 故障 诊断 时 是 通过 构造 多 个 二 分 类 器 组 
合 实现 多 分 类 功能 ， 并 利用 核 函 数 来 实现 线性 不 可 分 向 线性 可 
分 的 转换 。 研 究 表明 径 向 基 核 函数 在 SVM 中 表现 出 良好 的 泛 
化 能 力 ， 其 形式 如 式 (13) 所 示 。 


ly 


2 
es 
K(y,,z)) -op 5) -operly -zi (13) 


将 输入 向 量 从 原来 的 空间 映射 到 高 维特 征 空间 耳 ， 并 在 该 
特征 空间 HH 内 建立 优化 超 平面 。 分 类 线 方程 1 如 下 : 


O:XY+D=0 (14) 
yl®:x+b]>1 1=12 (15) 
其 中 : 2w 为 权 值 ; x 为 输入 向 量 ; b 为 闷 值 ，/ 为 向 量 的 个 数 。 


根据 Karush 一 Kuhn 一 Tucker， 优 化 各 个 系数 得 到 最 优 分 类 
函数 : 


JCD =sen(2 pao s) +h) (10) 
适应 度 函数 则 为 
f(o’ 2 
RD (17) 


式 (17) 可 知 ， 进行 SVM 分 类 模型 构建 时 ,性 能 的 关键 
因素 在 于 惩罚 参数 C 和 核 函 数 o 的 选取 , 本 文通 过 选用 烟花 算 
法 对 这 两 类 参数 进行 寻 优 。 
2.4 新 型 群体 智能 算法 一 烟花 算法 

烟花 算法 是 将 每 个 烟花 都 当做 一 个 解 空间 中 的 可 行 解 ， 通 
+ 爆炸 产生 不 同 的 烟花 点 作为 在 可 行 域内 进行 全 局 搜索 的 可 行 
解 。 通 过 每 个 烟花 的 适应 度 值 来 确定 爆炸 半径 和 爆炸 数 。 适 应 
度 值 越 小 的 点 ， 爆 炸 范围 越 小 ， 爆 炸 数 越 多 ， 适 应 度 值 大 的 则 
相反 。 烟 花 算 法 核心 包括 爆炸 算 子 、 变 异 操作 、 映 射 规则 、 选 
择 策略 四 部 分 中。FWA 寻 优 收敛 具体 步骤 如 下 : 

a) 在 解 空间 内 随机 初始 W 个 位 挨 ， 有 X 个 烟花 ; 

b) 计算 每 个 烟花 的 适应 度 值 ， 与 它们 的 爆炸 半径 Rad 和 
爆炸 火花 个 数 55; 为 


党 


Rod = RC as 
PF) -ym)+e 人 

Co AC 
Se 加 
其 中 ，ymm =min(f(%)(i=1,2,.…N) 是 当前 迭代 中 的 最 优 值 ， 也 
为 最 小 值 ， 而 式 ys =max(f(%)(i=1,2,.…N) 为 当前 迭代 中 的 
最 劣 值 ， 也 为 最 大 值 ，RC 和 HH 分 别 表 示 用 来 调整 爆炸 半径 的 


大 小 和 爆炸 火花 数 的 大 小 ; 
作 。 

为 了 避免 爆炸 火花 优 或 劣 的 适应 度 值 产 生 过 多 或 过 少 ， 文 
献 [14] 对 火花 个 数 作 出 如 下 的 限制 : 


2 表示 机 器 最 小 量 ， 避 免 出 现 零 操 
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round(a* H),S, <aH 
S, =4round(b*H),S, >bH,a<b<l (20) 
round(S,), 其 他 
c) 产生 爆炸 火花 ， 集合 DC 具有 z 个 维度 ， 
z=round(Dxrand(0,1])), 在 DC 中 的 每 个 维度 大 下 进行 爆炸 操 
作 后 ， 再 经 过 越界 处 理 将 exx 保存 到 火花 种 群 中 。 
h= Rad, xrand(—l,]) (21) 


Exix = Xx +h (22) 
Xx 为 第 i 个 烟花 的 第 维 ;，exi 为 爆炸 


其 中 : 7 为 偏 移 量 ; 
操作 后 的 火花 。 

d) 进行 高 斯 变异 操作 ， 每 个 维度 通过 式 〈23 ) 进行 高 斯 变 

异 后 ， 再 经 过 越界 处 理 保存 到 高 斯 种 群 当中 。 

Mx = Xx Xe (23) 

e) 选择 操作 , 在 所 有 得 到 的 种 群 中 挑选 最 好 的 一 个 ， 另 外 

NI 个 则 进行 轮 盘 赌 法 进行 选择 。 


R(x,) 


p(X;) = 5 Rx) (24) 
RG)= 2 dx 5)= 2 sl (25) 


f) 判断 是 否 满足 终止 选 代 条 件 ， 若 满足 输出 最 优 目 标 值 ， 
不 满足 就 继续 迭代 。 
2.5 ”基于 FWA-SVM 故障 诊断 模型 构建 
利用 烟花 算法 对 SVM 的 参数 进行 寻 优 , 其 步骤 如 下 所 示 ; 
a) 设 定 SVM 参数 范围 。 确 定式 (17) 的 两 个 参数 所 选 的 范 


mn 
utr 


b) 烟 花 种 群 初始 化 。 设 定 烟 花 种群 个 数 、 子 代数 、 高 斯 算 
子 、 最 大 迭代 数 等 参数 。 
c) 故 障 数据 KECA 降 维 。 将 每 个 子 时 段 故 障 数据 进行 
KECA 处 理 ， 按 照 焙 值 大 小 获得 主 元 结构 实现 数据 降 维 ， 以 便 
于 代入 故障 诊断 模型 内 进行 高 效 诊断 。 
d)FWA-SVM 模型 训练 。 将 处 理 后 的 故障 数据 代入 各 自 的 
子 时 段 FWA-SVM 模型 内 进行 训练 。 
6 输出 最 优 参数 。 当 和 友 代 次 数 满足 终止 迭代 条 件 后 各 子 时 
段 模型 输出 最 优 参数 构建 最 优 诊断 模型 。 
基于 FWA-SVM 故障 诊断 模型 构造 流程 如 图 2 所 示 : 
2.6 基于 KECA 和 FWA-SVM 的 间歇 过 程 分 时 段 故 障 诊断 
本 文 提 出 的 间歇 过 程 分 时 段 故 障 诊断 分 为 离线 各 分 类 器 的 
构建 和 在 线 故 障 诊断 。 其 中 离线 分 类 器 计算 步骤 如 下 : 
a) 将 间 欣 过 程 划 分 各 时 段 ， 通 过 K-means 划分 算法 划分 为 
若干 个 子 时 段 。 
b) 收 集 各 子 时 段 所 有 故障 的 M 个 批 次 数据 , 定义 故障 类 别 
后 再 进行 数据 预 处 理 。 
9 在 预 处 理 后 的 数据 中 提取 发 生 故障 时 刻 之 后 若干 个 采样 
点 数据 作为 训练 集 数据 。 
d) 得 到 的 训练 集 数 据 进 行 KECA 处 理 ， 按 照 值 信息 大 小 


蔡 振 宇 ， 


选择 主 元 结构 进行 降 维 。 
e) 将 各 时 段 的 训练 集 数据 代入 所 属 子 时 段 FWA-SVM 诊断 
模型 内 进行 训练 ， 构 建 最 优 诊 断 模型 。 
进一步 实现 间歇 过 程 的 在 线 故 障 诊断 ， 其 步骤 如 下 ; 
a) 通 过 正常 工 况 下 的 若干 批 次 构造 MKPCA 监测 模型 ， 计 
算 T2 和 SPE 统计 量 99% 的 控制 限 。 
b) 将 采样 点 利用 当前 值 进行 填充 ， 对 完整 批 次 数据 做 数据 
预 处 理 后 计算 两 个 统计 量 T2 和 SPE， 监 测 判 断 采样 点 是 否 连 
续 三 次 超过 各 自 的 控制 限 ， 若 超出 则 有 故障 ， 否 则 正常 。 
c) 提 取 故 障 发 生 时 刻 后 若干 个 点 采样 时 刻 的 故障 数据 ， 进 
行 KECA 降 维 处 理 后 再 送 入 训练 好 的 FWA-SVM 诊断 模型 内 
进行 故障 诊断 。 


< 0 


通过 爆炸 过 程 生 通过 高 斯 变异 生 
成 火花 成 火花 
LS 

对 超出 边界 的 火花 应 用 映射 规则 
vy 
应 用 选择 策略 得 到 下 一 代 烟 花 种 群 


壬 足 终 下 N 


本 
输出 最 优 解 


图 2 FWA-SVM 故障 诊断 模型 构造 流程 


3 ”实验 仿真 


青 考 素 发 酵 过 程 是 一 种 典型 的 间歇 过 程 ， 本 文采 用 青霉素 
生产 仿真 软件 Pensim2.008 生 成 实验 数据 。 为 实现 准确 的 在 线 
故障 监测 ， 利 用 Pensim 模型 模拟 发 酵 时 间 为 400 h、 采 样 间隔 
为 0.5h 的 140 批 次 正常 数据 ， 青 霉 素 仿真 数据 共有 18 维 变量 
数据 。 监测 时 为 简便 而 高 效 只 选取 通风 率 、 搅 拌 器 功率 等 10 个 
影响 青霉素 发 酵 过 程 的 变量 ， 避 免 过 程 变量 过 多 ， 使 监测 效果 
不 明显 。 选 取 变 量 如 表 1 所 示 。 

间 砍 过 程 具有 时 段 特 性 , 将 初始 三 维 数据 矩阵 XIxJxK) 按 
采样 点 展开 为 二 维 矩 阵 数据 X(TxK)， 并 对 其 进行 标准 化 处 理 ， 
利用 K-means 划分 算法 划分 间 欣 过 程 ， 参考 青 才 素 发 酵 过 程 中 
各 个 变量 的 轨迹 图 0 选取 K-means 参数 上 为 4， 实 验 车 干 次 后 
选取 端点 出 现 频 率 最 高 的 作为 时 段 分 隔 点 ， 阶 段 划 分 结果 大 
0~49h、49~120h、120~255h、255~400h。 利 用 Pensim 模型 模 
拟 发 酵 时 间 为 400 h、 采 样 间隔 为 0.5 h， 并 且 在 每 个 子 时 段 都 
生成 故障 1、2、3 各 15 组 共 180 批 次 的 故障 数据 ， 如 表 2 所 
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示 。 故 障 1、2、3 依次 为 通风 率 故障 、 搅 拌 功 率 故障 和 底 物 流 。 量 后 , 对 剩 下 的 17 维 进行 数据 分 析 与 故障 诊断 。 利 用 各 时 段 已 


加 速率 故障 。 知 三 类 故障 作为 训练 集训 练 诊断 模型 ， 对 监测 出 故障 的 数据 集 
表 1 在 线 监测 建 模 所 选 变量 进行 故障 诊断 。 
参数 属性 变量 单位 取 值 范围 Sl 
pe a i 故障 诊断 时 需要 对 故障 数据 集 做 数据 预 处 理 ， 本 文 为 研究 
See i ee KECA 数据 降 维 对 间 敏 过 程 故 障 诊断 的 有 效 性 ， 对 已 知 故障 数 
WR a ep 据 集 和 监测 输出 的 故障 集 不 进行 数据 降 维 处 理 、KPCA 降 维 处 
设置 i Pp 蛙 和 PCA 降 维 处 理 与 进行 KECA 降 维 处 理 进行 对 比 实验 。 为 
时 证 poe 单独 研究 KECA 数据 降 维 效果 , 不 添加 其 他 方面 因素 影响 处 理 
汪 册 当 和 i 效果 ， 本 文 利 用 寻 优 效果 良好 的 遗传 算法 优化 SVM 参数 构造 
榜 掉 功率 吕 0 的 模型 进行 验证 对 比 ， 数 据 采用 子 时 段 255~400 h 故障 数据 ， 
Oe ee 结果 是 重复 5 次 的 平均 值 ， 如 图 3 和 表 3 所 示 。 
ns 底 物流 温度 K 295-296 
反应 器 温度 K 297-298 | | | | | | KECA 
ol 本 | 
表 2 3 类 不 同 故障 的 所 属 时 段 与 组 数 ol 
时 段 几 故障 1 故障 2 故障 3 
0-49 15 组 15 组 15 组 ss 
49-120 15 组 15 组 15 组 75 |- 
120-255 15 组 15 组 15 组 
255-400 15 组 15 组 15 组 "se 7 8 9 1 1 1 


降 至 维 数 
图 3 数据 处 理 方法 对 比 


3.1 在 线 监 测 仿真 
先 将 140 组 正常 工 况 批 次 的 三 维 数据 进行 数据 预 处 理 ， 包 从 图 3 可 以 看 出 ， 当 两 者 数据 处 理 方法 都 降 至 10 个 维度 
括 沿 批 次 展开 、 添 加 噪声 信号 和 进行 数据 标准 化 ; 再 取 前 40 组 时 正确 率 最 高 ， 此 时 KPCA、PCA 贡献 率 分 别 为 97%、90%， 
正常 批 次 数据 计算 T 和 SPE 统计 量 的 99% 的 控制 限 。 为 研究 而 KECA 则 超过 了 99% 的 业 值 信息 。 从 表 3 中 可 以 看 出 , 无 论 
MKPCA 运用 在 本 论文 中 的 监测 效果 ， 取 后 100 组 正常 批 次 数 ” 是 训练 集 正确 率 还 是 测试 集 正确 率 ，KECA 方法 都 明显 

据 用 来 研究 报错 率 。 另 外 ， 将 所 有 故障 数据 进行 正常 批 次 相同  KPCA 与 PCA 方法 。 不 进行 数据 降 维 的 诊断 效果 远 弱 于 前 
的 数据 预 处 理 ， 包 括 选取 10 个 相关 变量 、 添 加 白 噪 声 等 处 理 。 ”者 ， 即 使 训练 集 正确 率 很 高 ， 但 正确 率 低 ， 在 训练 时 出 现 过 拟 


< 


进行 在 线 监测 时 ， 由 于 需要 一 个 整体 批 次 信息 才能 实现 监测 ， 。 合 现象 ， 导 致 测试 效果 差 。 因 此 将 数据 作 正确 的 处 理 对 诊断 结 
而 在 线 监测 时 只 有 从 开始 到 当前 监测 采样 的 数据 信息 ， 本 文采 果 来 说 很 有 必要 ， 可 以 实现 故障 的 高 效 诊断 。 
用 当前 值 填充 监测 数据 以 满足 整体 批 次 数据 要 求实 现 监测 。 在 和 
线 监测 实验 结果 分 别 为 监测 报错 率 5%、 监 测 诊断 率 97.78%。 人 TY 

从 检测 的 诊断 效果 和 报错 率 上 可 以 说 明 MKPCA 在 间歇 过 下 Ge ee 
程 上 进行 监测 效果 较 好 。 虽 然 报错 率 5% 相 对 较 高 , 但 对 比 于 诊 ji a pe 
断 率 97.78% 来 说 还 是 相当 可 观 ,因为 对 于 大 多 数 间 区 过程， 达 ee 诅 人 i 
到 诊断 率 更 高 的 实用 效果 更 好 。 因 此 MKPCA 在 一 定 程度 上 还 ee i a 


是 可 以 准确 地 进行 在 线 故障 监测 ， 准 确 监测 故障 并 输出 故障 数 
据 集 及 其 各 所 属 子 时 段 ， 为 接 下 来 的 故障 诊断 做 好 充足 、 准 确 3.2.2 优化 算法 研究 对 比 


的 数据 准备 。 将 各 子 时 段 已 知 故障 数据 进行 KECA 数据 降 维 后 ,生成 各 
3.2 故障 诊断 仿真 实验 研究 子 时 段 的 训练 集训 练 模型 。 构 造 基 于 PSO 优化 SVM 模型 、GA 
为 提高 监测 效率 ， 只 提取 监测 数据 一 部 分 相关 变量 ， 但 对 ”优化 SVM 模型 和 交叉 验证 算法 优化 SVM 模型 , 与 本 文 提出 的 


于 故障 诊断 ， 变 量 数据 大 多 都 有 相关 性 。 因 此 监测 出 某 批 次 连 车 于 烟花 算法 优化 SVM 模型 进行 对 比 ， 分 别 记 为 PSO-SVM、 
续 三 次 超出 任 一 控制 限 的 故障 数据 后 取 连 续 20 个 采样 点 , 还 GA-SVM、CV-SVM、FWA-SVM. 各 算法 初始 参数 如 表 4 所 示 。 
原 该 采样 点 所 有 变量 和 其 各 所 属 时 段 信息 。 本 文采 用 的 青霉素 “利用 时 段 255~400h 故障 数据 进行 故障 诊断 ,结果 如 表 5 所 示 。 
仿真 实验 数据 过 程 变量 有 18 维 变量 ， 去 除 第 一 维 采 样 点数 变 从 表 5 可 以 看 出 ， 烟 花 算法 优化 SVM 模型 时 间 上 远 远 优 
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于 GA 和 PSO， 略 快 于 交叉 验证 算法 ， 主 要 在 于 算法 本 身 构造 表 6 阶段 效果 对 比 

上 的 不 同 : 烟花 算法 通过 分 布 式 信息 共享 ， 根 据 分 布 在 不 同 区 时 段 5 次 平均 诊断 率 平均 诊断 率 

域 烟花 的 适应 度 值 决定 爆炸 强度 大 小 和 辐射 范围 ; PSO 是 单项 0-49h 97.33% 

流动 ， 搜索 迭代 过 程 是 跟随 当代 最 优 解 ; GA 通过 选择 、 交叉 、 49-120h 91.33% 

变异 等 操作 , 一 代 一 代 寻 找 最 优 : CV 则 是 按照 网 络 划分 进行 层 人 


120-255h 92.33% 


层 搜 索 。 再 看 FWA-SVM 模型 正确 率 远 远 优越 于 PSO， 各 高 于 255-400h 95% 
GA 和 CV, 从 寻 优 效果 来 说 是 最 好 的 , 验证 了 该 方法 的 有 效 性 。 a ee 
综 上 ， 从 迭代 收敛 时 间 和 寻 优 正确 率 来 看 ， 利 用 烟花 算法 优化 
SVM 参数 应 用 于 间歇 过 程 来 说 是 最 适合 ， 效 果 最 佳 。 分 时 段 进行 故障 诊断 的 平均 诊断 率 是 93.99%, 比 整体 诊断 
表 4 各 算法 初始 参数 设 定 表 率 高 5% 左 右 , 并 且 所 有 时 段 诊 断 率 都 高 于 整体 诊断 率 , 这 充分 
算法 参数 对 应 值 或 区 间 说 明了 间 欣 过 程 的 时 段 性 。 因 此 ， 在 进行 间 欣 过 程 的 故障 诊断 
a ; 时 应 该 先 从 阶段 性 分 析 ， 将 过 程 合理 分 为 若干 个 子 时 段 ， 再 进 
po ee 行 故障 诊断 ， 提 高 诊断 效率 。 
PSO _ 测试 集 的 实际 分 类 和 预测 分 类 图 
惯性 权重 [0.3,0.9] Tt [ 实际 测试 集 分 类 
学 习 因子 1、2 1.2、 1.5 时 和 
种 群 数 大 小 20 
GA 
交叉 概率 0.4 1.5 上 |- 
变异 概率 0.01 _ 
1 0 200 250 300 
V 参数 大 小 3 测试 集 样本 
i 国 2 (a) 时 段 0~49 故障 诊断 
参数 范围 P 2 。。 。 ”测试 集 的 实际 分 类 和 预测 分 类 图 
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